Open In Colab

Laboratorio 9.

Visualizaciones interactivas


Participantes:

Carga de librerias

Visualizacion de datos

Al visualizar los datos se pueden ver todos los campos de la base de datos.

Limpieza y Procesamiento de Datos

Para la limpieza de los datos se haran cambios de todas las letras a minusculas, se eliminaran los signos de puntuación, emojis, URLs y stopwords. Finalmente también cabe mencionar que se debe de eliminar los reviews en los que tengan valores nulos en la columna review.text

Eliminacion de NAN's

Se eliminan todos los datos NA para no afectar la popularidad de los reviews por reviews que no aplican y no tienen información valiosa para nuestro análisis.

De Mayuscula a minuscula

Todas las palabras se vuelven minuscula para poder tener en el mismo grupo todas las palabras iguales y que se tome la popularidad de la palabra tomando en cuenta todas las veces que es mencionada.

Eliminación de caracteres especiales

Eliminamos todos los signos de puntuación para poder evalular las palabras individualmente. Se usa la puntuación de python para revisar que borrar.

Eliminacion de URLs

Eliminamos los elementos que son componentes de URLs para no tener más signos que nos interferan en el manejo de los datos durante el análisis.

Quitar emojis

El análisis que se realiza es para analizar las palabras que representan emociones positivas o negativas por lo que los emojis no son necesarios en este contexto y se eliminan por su código ascii.

Eliminacion de Stopwords

Las palabras que no representan ningún adjetivo y significado para clasificar un review como bueno o malo se eliminan por la función stopwords de Python.

Histograma de cantidad de reviews por rating

Positivas
Negativas

Teniendo en cuenta la cantidad de palabras positivas y negativas del review determine quétan positivo, negativo o neutral es el mismo para el producto.

Mapa #1

A continuacion podemos ver un mapa de estados unidos en donde se muestra por puntos la frecuencia de reviews que tuvieron por ciudad cada estado.

El usuario puede acercarse y alejarse, asimismo al posicionarse sobre un circulo le muestra la informacion pertinente para poder ver cuantos reviews son los que tiene.

Mapa 2

En este mapa podemos observar como es la dispersión de los coeficientes positivos y negativos realziador por el análisis de sentimientos para clasificar a los reviews como positivos y negativos. El usuario puede interactuar con el mapa al momento de posicionarse sobre cada punto, nos muestra el manufactor del producto, el nombre del producto y si el review que recibio es positivo o negativo.

Mapa 3

En este mapa podemos ver informacion acerca de los reviews categorizados como positvos segun el analisis de sentimientos. Se grafica en un mapa porque creemos importante saber de que lugares la mayoría de reviews vienen de, y aqui el usuario puede interactuar a traves de tener su cursos encima del mapa y puntos, en donde le muestra la marca del producto y cuantos reviews tuvo.

Mapa 4

En este mapa podemos ver informacion acerca de los reviews categorizados como negativos segun el analisis de sentimientos. Se grafica en un mapa porque creemos importante saber de que lugares la mayoría de reviews vienen de, y aqui el usuario puede interactuar a traves de tener su cursos encima del mapa y puntos, en donde le muestra la marca del producto y cuantos reviews tuvo.